LINUCS - Eine Notation zur Unterstützung von Repräsentation und Retrieval spezieller chemischer Strukturen
نویسندگان
چکیده
Structure-oriented retrieval is an essential feature of substance information systems. Chemists most often perform standard retrieval projects on their own and therefore prefer user surfaces that allow input according to chemical notation rather than requiring knowledge of special retrieval languages. SWEETDB, a glycosubstance information system, offers structure retrieval by using an input matrix that is fully conform to IUPAC nomenclature. A structure parser converts graphical 2D structure input into linear notation that is used for storage and graph matching. 1 Die LINUCS-Notation im Kontext der SWEET-DB Die SWEET-DB [Loß2002] ist ein Substanzinformationssystem, das Molekülstrukturen einer bestimmten Substanzklasse enthält (Kohlenhydrate). Diese Spezialisierung erlaubt den Gebrauch entsprechender Notationen, die effiDieses Dokument wird unter folgender creative commons Lizenz veröffentlicht: http://creativecommons.org/licenses/by-nc-nd/2.0/de/ 395 Elke Lang, Andreas Bohne-Lang, Claus-Wilhelm von der Lieth, Alexander Loß zienter sind als substanzklassenunabhängige Beschreibungsverfahren. Derartige Spezialnotationen haben sich z.B. für die Deskription und Suche von Proteinsequenzen eingebürgert [Berman2000]. Seit einiger Zeit werden Versuche unternommen, ein derartiges Verfahren auch für Kohlenhydrate zu entwickeln, wobei deren höhere strukturelle Komplexität, vor allem die Verzweigung, erhebliche Schwierigkeiten verursacht [Laine1994]. Die meisten Verfahren verlangen über die Standard-Nomenklatur [IUPAC1997] hinaus die Einhaltung weiterer Konventionen [Engelsen1996]. Die LINUCS-Notation [Lieth2001] bietet die Möglichkeit, Suchstrukturvorgaben mit einer Eingabematrix zu erstellen, in die wie gewohnt zweidimensionale (verzweigte) Strukturgraphen eingetragen werden können, die aus Monomertypund Bindungstyp-Elementen kombiniert werden. Der LINUCS-Parser wird zum einen verwendet, um bei der Aufnahme neuer Substanzdatensätze deren lineare Strukturnotation als Speicherformat zu erzeugen. Zum anderen wandelt er bei der Struktursuche die graphisch erstellte Strukturvorgabe in die lineare Notation um. Diese wird anschließend zum Graphvergleich benutzt. Die LINUCS-Notation ist durch ihre lineare Form rechnergeeignet und ermöglicht eine schnelle Struktursuche; auch Ähnlichkeitsund Teilstruktursuche sind möglich. Bei der Aufnahme neuer Daten bietet LINUCS die Möglichkeit, neu aufgenommene Strukturen auf Plausibilität zu untersuchen. Das LINUCS-Verfahren und die SWEET-DB sind unter http://www.dkfzheidelberg.de/spec/ zugänglich, dort sind auch einführende Beispiele zu finden.
منابع مشابه
Fallbasierte Unterstützung von Experten im Bereich Service und Support: ein Ansatz auf Basis von Beschreibungslogiken mit ausdrucksstarken konkreten Gegenstandsbereichen
Kernelemente eines Systems, das die Anforderungen von Wartungstechnikern und anderen Mitarbeitern des Second-Level-Support erfüllt, sind eine objektorientierte Repräsentation des Domänenund des Hintergrundwissens und ein flexibles, semantisch fundiertes Retrieval unter Berücksichtigung des Hintergrundwissens. Zur Unterstützung ihrer Aufgaben sind die im Rahmen fallbasierter Help-Desk-Systeme en...
متن کاملEin computerbasiertes Hirnatlas-System nach Talairach
Zusammenfassung. Computerisierte Hirnatlanten sind ein wertvolles Hilfsmittel und Werkzeug für viele neurologische Fragestellungen. Die Rechenleistung moderner Computersysteme ermöglicht potentiell eine Vielzahl von Darstellungsund Interaktionsoptionen, die rechnergestützte Atlanten gegenüber den konventionellen gedruckten Büchern aufwerten. Wir stellen in dieser Arbeit eine digitale Version de...
متن کاملTechnologien zur Wiederverwendung von Texten aus dem Web
Texte aus dem Web können einzeln oder in großen Mengen wiederverwendet werden. Ersteres wird Textwiederverwendung und letzteres Sprachwiederverwendung genannt. Zunächst geben wir einen Überblick darüber, auf welche Weise Text und Sprache wiederverwendet und wie Technologien des Information Retrieval in diesem Zusammenhang angewendet werden können. In der übrigen Arbeit werden dann eine Reihe sp...
متن کاملBericht über den Workshop Software-Architektur und Migration im Rahmen der Software-Engineering 2007, 27. März 2007 in Hamburg
Software-Architekturen sind wichtige Artefakte zur Unterstützung der Software-Entwicklung und SoftwareEvolution. Ziel der Entwicklung von SoftwareArchitekturen ist es, Beschreibungen für grundlegende Strukturen von Softwaresystemen oder Familien von Softwaresystemen zu erhalten, die einerseits die Anforderungen an das System oder an Produktfamilie reflektieren und andererseits, neben weiteren M...
متن کاملHAMVIS: Generierung von Visualisierungen in einem Rahmensystem zur systematischen Entwicklung von Benutzungsschnittstellen
Structure Representation Visual Structure Representation Picture Data Synthesizer (created for each type of data) Analyzer (created for each type of data) (asserted predicates in Prolog) (asserted predicates in Prolog) Inverse Visual Mapping (Prolog) Visual Mapping (Prolog) Spatial Parser (Objective C) COOL (COnstraintbased Object Layout system) Interaction Module (on NextStep) 2.3 Graphische K...
متن کامل